ลักษณะโดยทั่วไป: การเรียนรู้ในขณะค้นหาค่าเหมาะสุด ของ การหาค่าเหมาะสุดอย่างตอบสนอง

RSO learning loop

การค้นหาค่าเหมาะสุดอย่างตอบสนองก็เหมือนวิธีการค้นเฉพาะที่ทั่วๆไปที่ถูกนำมาใช้แก้ปัญหาจำพวกการหาโครงแบบที่เหมาะสมของระบบ โดยที่โครงแบบดังกล่าวมักจะประกอบด้วยตัวแปรที่เปลี่ยนแปลงไปมาทั้งในลักษณะที่ต่อเนื่องและไม่ต่อเนื่อง แต่ในขณะเดียวกันเกณฑ์ในการหาค่าเหมาะสุดนั้นเป็นเพียงตัวเลขตัวเดียว ส่วนใหญ่แล้วปัญหาการหาค่าเหมาะสุดนั้นมักจะถูกลดรูปไปสู่ปัญหาการหาค่าน้อยที่สุดของฟังก์ชันที่มีอากิวเมนต์ของฟังก์ชันคือตัวแปรโครงแบบที่ถูกมองว่าเป็นตัวแปรอิสระในโดเมนของฟังก์ชันนี้

การค้นหาค่าเหมาะสุดอย่างตอบสนองนั้นสนับสนุนการผสมผสานกันระหว่างวิธีการการเรียนรู้ของเครื่องจักรภายใต้วิธีทางสัญลักษญ์(sub-symbolic machine learning)และการศึกษาสำนึกด้วยวิธีการค้นหา(search heuristics) เพื่อร่วมกันแก้ปัญหาการค้นหาค่าเหมาะสุดที่ซับซ้อน คำว่า "อย่างตอบสนอง" นั้น หมายถึงพร้อมเสมอที่จะตอบสนองต่อเหตุการณ์ระหว่างการค้นหา ทั้งประวัติในการค้นหาและความรู้ต่างๆที่เก็บสะสมมาในขณะที่เคลื่อนตัวผ่านพื้นที่โครงแบบนั้นถูกใช้ในการปรับตัวเองอย่างอัตโนมัติ ซึ่งขั้นตอนวิธีการนี้ได้ถูกสร้างขึ้นมาเพื่อให้มีความยืนหยุ่นต่อการจัดการกับปัญหาที่แตกต่างในระหว่างการค้นหา หรือกล่าวโดยสรุปว่ามันมีความมสามารถในการปรับตัวอย่างอัตโนมัติโดยการตัดสินใจจากประสบการณ์ในอดีตนั่นเอง

Da Vinci's man, RSO inspiration

ในโลกแห่งความเป็นจริงนั้น คนต้องพบเจอกับปัญหาในชีวิตประจำวันมากมาย เรามักเลือกตัดสินปัญหาหลายๆอย่างโดยยึดจากการสังเกตและเรียนรู้ประสบการณ์ที่ผ่านมาในอดีตเป็นแนวทางในการแก้ไขและพัฒนา นอกจากนี้สมองของคนมีการเรียนรู้ที่รวดเร็วทำให้ในบางครั้งที่ตัดสินใจทำอะไรไปแล้ว ก็สามารถต้องเปลี่ยนแผนกลางครันเมื่อเห็นว่าเราเดินมาผิดทางและมีทางที่น่าจะได้ผลดีกว่าทางปัจจุบัน ด้วยพฤติกรรมของคนนี้เองเป็นแบบอย่างให้เกิดขึ้นตอนวิธีนี้ขึ้น เพราะในโลกของการแก้ปัญหาทางคอมพิวเตอร์นั้นก็มีวิธีการค้นหาคำตอบมากมายผ่านปริภูมิการค้นหา(search space)เช่นเดียวกัน ทำให้เกิดการเพิ่มวิธีการเรียนรู้ของเครื่อง(machine learning)ไปสู่การค้นหาค่าเหมาะสุดอย่างตอบสนอง

ปัญหาการปรับค่าตัวแปรในกระบวนการศึกษาสำนึก

การศึกษาสำนึกในปัญหาการค้นหาส่วนใหญ่เช่น กาค้นหาด้วยวิธีการทาบู (tabu search) และการหลอมลวง (simulated annealing) ได้ถูกนำมาใช้ในโปรแกรมคอมพิวเตอร์อย่างมีประสิทธภาพและมีประโยชน์ โดยการศึกษาสำนึกเหล่านี้มีลักษณะที่อ่อนไหวต่อตัวแปรภายในเป็นอย่างมาก ตัวอย่างเช่นปัญหาการหลอมลวงซึ่งขึ้นอยู่การตารางเวลาการหลอมบ่อยครั้งถูกอธิบายโดยตัวแปรอัตราการทำให้เย็นตัวลง(cooling rate) โดยค่าที่เหมาะที่สุดมีควาแตกต่างไปตามแต่ละกรณีซึ่งกำลังถูกแก้ไป ดังนั้นขึ้นตอนวิธีเดียวกันจึงต้องการค่าการเปลี่ยนที่ดีและแน่นอนเพื่อที่สามารถนำมาใช้กับปัญหาใหม่ได้ ในขั้นตอนการหาค่าเหมาะสุดโดยทั่วไปผู้ออกแบบมักจะใส่การปรับเปลี่ยนเพียงเล็กน้อยในขึ้นตอนวิธีนั้นเพื่อเพิ่มความเร็วของระบบ

เป็นที่สังเกตว่าผลการวิจัยจำนวนมากที่เกี่ยวกับการศึกษาสำนึกการค้นหาค่าเหมาะสุดมีความลำเอียงมาจากปัญหานี้ เพราะในบางครั้งประสิทธิภาพของขั้นตอนวิธีถูกคำนวณหลังจากที่ได้เปลี่ยนตัวแปรแล้ว ทั้งที่จริงแล้วกำลังทั้งหมดของการหาค่าเหมาะสุดรวมถึงเวลาในการปรับค่าตัวแปรควรที่จะถูกรวมเข้ามาคิดด้วย

การปรับค่าตัวแปรในฐานะองค์ประกอบหลักของการศึกษาสำนึก

การค้นหาค่าเหมาะสุดอย่างตอบสนองให้วิธีการแก้ปัญหาโดยการบวกกลไกการปรับค่าตัวแปรลงไปในขึ้นตอนวิธีการค้นหาด้วยตัวมันเอง ซึ่งตัวแปรเหล่านี้จะถูกปรับด้วยวงวนการป้อนข้อมูลอัตโนมัติตัวหนึ่งซึ่งจะปรับตัวไปตามคุณภาพของวิธีแก้ปัญหาที่พบ โดยยึดจากประวัติการค้นหา และจากเกณฑ์อื่นๆ

ประโยชน์

  • ความอัตโนมัติของวิธีการหาค่าเหมาะสุดรวมถึงความอัตโนมัติของขึ้นตอนการปรับค่าตัวแปรที่เหมาะสม
  • การปรับตัวพลวัตของตัวแปรการค้นหา ซึ่งอาจจะเกิดขึ้นในทุกๆก้าวของการค้นหา นำไปสู่เวลาในการหาค่าเหมาะสุดรวมที่เร็วขึ้น
  • รูปแบบที่เพิ่มขึ้นของผลลัพธ์เพราะขั้นตอนวิธีที่สมบูรณ์แบบของการปรับค่าตัวแปร

ใกล้เคียง

การหายใจระดับเซลล์ การหายตัวไปของสึซึมิยะ ฮารุฮิ การหารด้วยศูนย์ การหาอายุจากคาร์บอนกัมมันตรังสี การหารสังเคราะห์พหุนาม การหาค่าเหมาะที่สุดแบบเฟ้นสุ่ม การหาค่าเหมาะสุดอย่างตอบสนอง การหาร การหาลำดับนิวคลีโอไทด์ด้วยวิธีอิลลูมินา การหารยาว